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摘 要 中 文 是 全 球 华 人 广泛 使 用 的 文字 ， 特 点 鲜明 。 由 于 其 特异 性 ， 西 方 语言 
理论 和 模型 无 法 直接 应 用 于 中 文 。 现 有 中 文 词 汇 加 工 研究 中 ， 缺 乏 系统 的 计算 
模型 来 模拟 词汇 语义 加 工 过 程 。 本 研究 由 在 通过 计算 建 模 和 实验 研究 方法 解决 
上 述 问 题 。 研 究 将 系统 回顾 中 文 词汇 加 工 已 有 研究 并 进行 元 分 析 ， 构 建 模 型 以 
模拟 中 文 词汇 在 孤立 呈现 及 句子 语 境 中 的 加 工 过 程 。 该 模型 能 够 加 工 单字 词 和 
多 字 词 ， 模 拟 词 的 形 、 音 、 义 的 加 工 过 程 及 交互 作用 ， 并 考虑 语 境 中 上 下 文 的 
影响 。 最 后 ， 通 过 实验 研究 验证 模型 假设 。 本 研究 建立 的 中 文 词汇 语义 加 工 模 
型 有 助 于 理解 中 文 阅读 特异 性 认 知 机 制 和 词汇 加 工 的 动态 过 程 。 
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1 研究 意义 

近年 来 ， 建 模 方法 在 理解 语言 认 知 机 理 方面 发 挥 着 重要 作用 。 一 方面 ， 通 
过 不 断 完善 模型 参数 和 结构 ， 能 够 较 准 确 地 刻画 认 知 加 工 过 程 。 另 一 方面 ， 模 
型 可 以 在 一 个 框架 内 模拟 和 解释 众多 实验 数据 ， 包 括 使 用 不 同 研究 设计 采集 的 
数据 和 某 些 不 一 致 的 结果 。 西 方 学 者 针对 字母 语言 的 阅读 认 知 机 制 进行 了 大 量 
研究 ， 并 提出 了 相应 的 理论 和 模型 (Dehaene, 2009; Engbert & Kliegl, 2011; 
Reichle, 2021; Reichle et al., 1998; Seidenberg, 2017)。 然 而 ， 在 过 去 一 段 时 间 ， 
研究 人 员 已 经 认识 到 ， 针 对 字母 语言 的 研究 结果 和 计算 模型 并 不 总 是 能 推广 到 
不 同 的 书写 系统 (Share, 2008). 

中 文 是 表意 文字 ， 有 具有 许多 特性 。 首 先 ， 中 文书 写 系统 使 用 的 是 汉字 而 不 
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是 字母 。 与 字母 或 单词 相 比 ， 汉 字 及 其 构成 的 字符 串 承 载 了 较 多 的 语义 信息 和 
较 少 的 语音 信息 。 其 次 ， 中 文 词 长 较 短 ， 大 多 只 有 一 两 个 字 ， 而 德语 、 芬 兰 语 
等 语言 的 词语 长 度 往往 超过 10 个 字母 。 最 后 ， 中 文 文 本 中 没有 标识 词 边界 的 空 
格 ， 于 是 中 文 读者 必须 以 某 种 方式 从 连续 的 字符 串 中 切 分 并 识别 词 。 因 此 ， 为 
字母 书写 系统 开发 的 模型 并 不 总 是 适用 于 表意 文字 系统 (Li et al., 2022)。 目 前 ， 
还 没有 为 中 文 的 词汇 语义 加 工 专门 设计 的 计算 模型 。 建 立 这 样 一 个 模型 有 利于 
理解 中 文 词汇 加 工 的 认 知 机 制 ， 并 能 够 指导 后 续 研 究 。 此 外 ， 通 过 将 中 文 词汇 
加 工 模型 和 基于 字母 语言 提出 的 其 他 模型 对 比 ， 有 利于 理解 跨 语言 普遍 性 与 特 
异性 的 阅读 认 知 机 制 。 

本 研究 拟 聚 焦 中 文 词汇 语义 加 工 ， 基 于 对 以 往 实验 研究 结果 的 分 析 和 总 
结 ， 提 出 原创 性 理论 假设 ， 并 建立 中 文 词汇 语义 加 工 的 计算 模型 以 模拟 孤立 词 
的 语义 加 工 过 程 ， 随 后 进一步 探究 语 境 对 词汇 语义 加 工 的 影响 机 制 ， 构 建 能 够 
模拟 句子 阅读 过 程 中 词汇 语义 加 工 的 计算 模型 ， 最 后 ， 通 过 实验 对 模型 中 的 重 
要 假设 和 预测 进行 验证 ， 并 根据 实验 结果 进一步 修正 和 优化 计算 模型 。 本 研究 
具备 新 颖 性 、 交 叉 性 和 开创 性 ， 有 助 于 理解 中 文 阅读 特异 性 的 认 知 机 制 ， 进 而 
推动 跨 语言 比较 和 语言 认 知 科学 相关 领域 的 发 展 。 
2 研究 现状 及 发 展 动态 分 析 
2.1 中 文 复合 词 加 工 的 认 知 机 制 

在 词汇 加 工 研究 领域 ， 一 个 重要 问题 是 词 是 作为 一 个 整体 还 是 通过 分 解 进 
行 加 工 。 受 研究 方法 、 任 务 和 语 料 的 影响 ， 该 领域 的 研究 结果 多 样 。 在 中 文 阅 
读 中 ， 一 些 研究 结果 支持 整体 加 工 。 首 先 ， 眼 动 实验 发 现 ， 人 为 干扰 词 作为 整 
体 进 行 加 工 〈 如 在 词 内 揪 入 空格 ) 导致 词汇 加 工 速度 变 慢 (Bai et al., 2008; Li et 
al., 2013)。 第 二 ， 在 拼音 文字 和 中 文 阅读 中 都 存在 词 优 效 应 ( 申 薇 , ET, 2012; 
Reicher, 1969)。 表 现 为 与 出 现在 非 词 中 的 字 〔 如 “ 审 卖 ” 中 的 “ 审 ”) 相 比 ， 识 别 
真 词 中 的 字 ( 如 “审查 ”中 的 “ 审 ”) 更 快 、 更 准确 。 最 后 ， 中 央 凹 和 副 中 央 四 加 
工 的 眼 动 实验 结果 表明 ， 与 短语 相 比 ， 三 字 习 语 条 件 下 预 视 效 应 更 大 ， 说 明 习 
语 在 表征 和 加 工时 被 作为 一 个 独立 的 单元 (Yu et al., 2016; Zang, 2019)。 男 一 些 研 
究 则 关注 字 频 效应 ， 假 设 复合 词 加 工 中 的 字 频 效应 反映 分 解 的 加 工 过 程 。 但 已 
有 结果 并 不 一 致 。 有 的 研究 发 现 了 字 频 的 促进 作用 ( 王 春 茂 , 彭 聘 龄 , 1999; Tse & 
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Yap, 2018; G. Yan et al., 2006)， 男 外 一 些 发 现 了 阻碍 作用 (Cui et al., 2021; Xiong 


et al., 2023; Yu et al., 2021)， 还 有 一 些 研究 未 发 现 显 著 的 字 频 效应 (Li et al., 2014; 
Ma et al., 2015)。 中 文 的 特殊 性 在 于 汉字 有 具有 丰富 且 独 立 的 信息 表征 ， 多 数 情况 
下 ， 一 个 汉字 对 应 一 个 语素 ， 既 能 表示 字形 和 字音 ， 也 列 含 丰富 的 语义 。 曹 海 
BEF (2023) 发 现 中 文 读 者 能 够 利用 语素 特征 帮助 词 切 分 和 词 识别 。 这 些 书 写 
系统 的 特异 性 可 能 使 中 文 复合 词 的 加 工 机 制 更 复杂 。 
除了 正字 法 水 平 的 加 工 ， 在 语义 水 平 上 也 存在 整体 和 分 解 加 工 的 争论 。 掩 

蔽 启动 范式 的 研究 结果 表明 ， 与 仅 共享 字形 而 语素 语义 不 同 的 条 件 相 比 ， 当 启 
动词 和 目标 词语 素 语 义 也 相同 时 ， 对 目标 词 的 识别 速度 更 快 (Tsang et al., 2014; 
Tsang & Chen, 2013; X. Zhou & Marslen-Wilson, 2000)。 该 结果 说 明 在 词汇 识别 
早期 阶段 ， 读 者 加 工 了 语素 语义 。 来 自 神经 影像 学 的 证 据 同 样 支 持 语 义 分 解 加 
工 的 观点 。 左 侧 里 叶 前 部 在 短语 加 工 研究 中 被 证 明 与 语义 合成 有 关 (Bemis & 
Pylkkänen, 2011; Flick et al., 2018; Pylkkänen, 2020; Westerlund & Pylkkänen, 
2014)。 一 项 脑 磁 图 研究 比较 了 中 文 读者 在 加 工 并 列 、 偏 正 、 动 宾 复 合 词 或 单 语 
素 词 时 的 神经 活动 模式 ， 结 果 显 示 加 工 复 合 词 时 该 区 域 激 活 增强 ， 这 提示 中 文 

合 词 加 工 存在 语义 合成 的 过 程 (Hsu et al., 2019)。 然 而 ， 利 用 句子 阅读 任务 下 
的 眼 动 跟踪 研究 却 发 现 ， 成 分 语素 的 语义 并 不 会 参与 句子 语义 整合 ， 而 是 以 词 
为 单位 整体 加 工 语义 (Shen et al., 2018; J. M. Yang et al., 2012; J. Zhou & Li, 


2021). 

以 往 研究 对 于 复合 词 加 工 的 认 知 机 制 得 到 了 不 同 结果 ， 采 用 整体 还 是 分 解 
加 工 ， 以 及 语素 加 工 和 复合 词 加 工 之 间 存 在 怎样 的 关系 ， 目 前 还 没有 答案 。 生 
对 同一 个 研究 问题 ， 不 同 的 研究 得 出 了 不 同 的 结果 与 结论 。 例 如 ， 字 频 的 效应 
在 不 同 研究 中 不 一 致 ， 难 以 确定 是 否 能 够 被 作为 词汇 分 解 加 工 的 证 据 。 因 此 ， 
需要 探讨 导致 矛盾 结果 的 原因 ， 以 及 是 否 存在 其 他 合理 解释 。 

2.2 词汇 加 工 中 语音 通路 的 作用 

针对 语音 通路 在 词汇 加 工 中 的 作用 ， 研 究 者 关注 两 个 问题 : 视觉 词汇 加 工 
中 词汇 语音 信息 是 否 激活 ， 以 及 语音 对 通达 词汇 语义 信息 是 否 起 到 中 介 作用 。 
为 了 探测 语音 信息 的 激活 ， 研 究 者 采用 同音 假 词 作为 材料 ， 拼 音 文 字 和 中 文 研 
究 的 结果 都 发 现 了 同音 假 词 效应 。 由 于 受到 同音 词 的 和 干扰， 识别 同音 假 词 的 速 
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度 比 识别 非 同音 假 词 更 慢 ， 这 提示 视觉 词汇 加 工 中 激活 了 语音 信息 (Van Orden 
& Kloos, 2005; X. Zhou et al., 2009)。 此 外 ， 句 子 阅 读 研究 发 现 了 语音 线索 的 促 
进 作 用 (W. Zhou et al., 2018) 和 绕口令 效应 (McCutchen & Perfetti, 1982; S. Zhang 
& Perfetti, 1993)， 同 样 支持 了 语音 信息 在 视觉 词汇 加 工 中 激活 ( 详 见 Rayner et 
al., 2011). 

中 文 阅读 中 ， 关 于 语音 在 词汇 语义 理解 中 的 作用 ， 主 要 存在 两 种 理论 。 语 
音 中介 理 论 主张 语音 是 词汇 识别 的 重要 组 成 部 分 ， 为 词汇 识别 提供 了 早期 制 
约 ， 而 不 是 可 有 可 无 的 过 程 或 副产品 (Tan & Perfetti, 1997, 1998, 1999). Leck 等 
(1995) 采用 语义 分 类 任务 ， 发 现 复合 结构 单字 词 的 任务 表现 同时 受到 字形 和 语 
音信 息 的 影响 ， 简 单 结 构 单 字 词 的 任务 表现 只 受 字形 的 影响 。 另 一 项 中 文 双 字 
词 识 别 的 研究 发 现 ， 同 音 异 义 启动 词 比 无 关 启 动词 对 目标 词 的 语义 判断 产生 了 
更 大 的 干扰 (Tan & Perfetti, 1999)。 直 接 语义 通达 理论 则 认为 词 形 直接 激活 语义 
言 息 ， 在 中 文 视 觉 词 汇 识别 中 不 存在 语音 加 工 ， 并 且 / 或 者 语义 激活 时 间 早 于 语 
音 (Tan & Perfetti, 1997; Wong et al., 2014)。 早 期 的 行为 研究 使 用 启动 范式 ， 通 过 
操控 启动 词 与 目标 词 之 间 的 时 间 间 隔 ， 考 察 形 、 音 、 义 激活 的 时 间 进 程 ， 其 轴 
辑 是 认为 最 小 的 启动 效应 时 间 间 隔 可 以 反映 激活 表征 所 需 的 时 间 ， 不 同 研究 结 
果 支 持 不 同 的 理论 。Perfetti 和 Zhang (1995) 发 现在 单字 词 识 别 任务 中 ， 语 音 干 
扰 效 应 出 现 的 时 间 早 于 语义 和 干扰， 符合 语音 中 介 理 论 的 预期 。 然 而 ，Zhonu 等 
《2000) 在 双 字 词 判断 任务 中 发 现 语义 信息 的 激活 早 于 语音 ， 而 在 词汇 命名 任 
务 中 ， 语 音 与 语义 的 激活 几乎 同时 ， 这 些 结果 不 文 持 语音 中 介 理 论 。 这 类 研究 
普遍 存在 两 个 问题 ， 一 方面 Perfetti 等 (2005) 指出 ， 相 对 时 间 进 程 并 不 能 作为 
语音 中 介 通 达 语 义 的 证 据 ， 因 为 即使 不 通过 语音 中 介 通 路 ， 语 义 激活 时 间 也 可 
能 晚 于 语音 激活 ; 另 一 方面 ， 这 类 研究 的 实验 操作 与 自然 阅读 中 的 词汇 加 工 差 
异 很 大 ， 存 在 外 部 效 度 较 差 的 问题 。 

当前 研究 对 中 文 词汇 识别 中 语音 加 工 的 相关 问题 探讨 不 充分 ， 语 音 通路 的 
激活 对 语义 通达 的 作用 有 待 进一步 研究 。 虽 然 有 一 些 证 据 表明 在 中 文 阅 读 过 程 
中 激活 了 词 的 语音 信息 ， 但 是 否 可 以 通过 语音 中 介 通 达 语 义 还 没有 定论 。 
2.3 语 境 对 中 文 词 加 工 的 影响 

在 自然 阅读 中 ， 词 汇 加 工 并 非 孤 立 发 生 ， 而 是 嵌入 在 句子 里 ， 这 就 会 受到 


相 邻 词 及 句子 语 境 的 影响 。 句 子 中 的 词汇 加 工 比 孤立 呈现 的 词 的 加 工 更 复杂 ， 
主要 体现 在 以 下 几 个 方面 。 

第 一 ， 中 文句 子 里 缺乏 明确 的 词 边界 标记 ， 故 中 文 阅读 首先 需要 确定 哪 几 
个 字 表示 一 个 词 。 在 缺少 低 水 平视 觉 线索 〈 如 空格 ) 的 情况 下 ， 中 文 读者 需要 
依赖 更 高 水 平 的 信息 《如 语言 知识 和 语 境 ) 实现 词 切 分 ， 这 一 点 与 拼音 文字 不 
同 。 词 切 分 的 认 知 机 制 研究 揭示 其 包含 两 个 加 工 阶段 : 在 第 一 个 阶段 ， 读 者 根 
据 词 频 等 局 部 信息 得 到 初始 切 分 结果 ; 在 第 二 个 阶段 ， 读 者 根据 句子 语 境 检查 
初始 切 分 是 否 正确 ， 错 误 切 分 则 需要 额外 的 修正 时 间 (Huang et al., 2021; Huang 
& Li, 2020; Inhoff & Wu, 2005; Li et al., 2009; Ma et al., 2014; J. Zhou & Li, 
2021)。 以 往 基 于 字母 语言 构建 的 词汇 加 工 模型 难以 模拟 具有 中 文 特异 性 的 词汇 
和 句子 加 工 过 程 。 

第 二 ， 句 子 阅 读 时 的 词汇 加 工会 受到 视觉 注意 和 阅读 方向 的 影响 。 在 研究 
中 文 孤立 词 的 加 工 的 实验 中 ， 一 个 词 的 所 有 字 往 往 同 时 出 现在 读者 的 知觉 范围 
内 ， 也 就 能 够 被 同时 加 工 。 然 而 在 句子 阅读 时 ， 读 者 的 眼睛 从 堪 向 右 移动 ， 注 
视 位 置 不 固定 。 因 此 ， 一 个 词 中 的 多 个 字 在 加 工时 序 上 可 能 存在 差异 ， 靠 近 注 
视点 的 字 会 比 远离 注视 点 的 字 先 得 到 加 工 。 另 外 ， 一 次 注视 可 以 同时 加 工 多 个 
字 ， 而 这 些 字 可 能 属于 同一 个 或 几 个 不 同 的 词 。 这 些 现象 在 孤立 词 的 加 工 中 不 
存在 ， 却 都 有 可 能 对 词汇 加 工 机 制造 成 影响 。 

第 三 ， 句 子 语 境 影响 词汇 加 工 。 研 究 发 现 预测 性 高 的 词 比 预测 性 低 的 词 阅 
读 时 间 更 短 ， 这 说 明 读 者 在 阅读 中 利用 前 文 语 境 持续 预测 ， 预 先 激活 的 信息 对 
词汇 语义 通达 产生 促进 作用 ( 刘 志 方 等 , 2020; Cui et al., 2022; Rayner et al., 2005; 
Yao et al., 2022)。 此 外 ， 语 境 还 能 够 帮助 读者 在 加 工 歧义 词 时 快速 选择 合适 的 语 
X(Shen & Li, 2016). fln, “火星” 一 词 既 可 以 表示 特定 的 行星 ， 也 可 以 表示 可 
能 引起 火灾 的 事物 ， 上 其 体 表达 的 含义 需要 根据 上 下 文 语 境 来 确定 。 

由 此 可 见 ， 名 子 中 的 词汇 加 工 与 孤立 词 的 加 工 存在 一 些 差 异 ， 而 以 孤立 词 
为 对 象 得 到 的 研究 结论 不 一 定 适 用 于 句子 阅读 。 句 子 中 词汇 的 加 工 往往 比 单独 
呈现 时 更 复杂 ， 与 孤立 词 的 加 工 机 制 可 能 存在 差异 。 当 前 探讨 词汇 加 工 机 制 的 
模型 极 少 考虑 句子 的 影响 。 因 此 ， 为 了 完整 地 理解 中 文 词汇 语义 加 工 的 认 知 机 
制 ， 有 必要 进一步 探讨 句子 特征 和 语 境 在 词汇 认 知 中 的 作用 。 


2.4 词汇 加 工 认 知 模型 的 发 展 

为 了 理解 语言 的 加 工 机 制 ， 学 者 们 建立 了 许多 认 知 模型 。 交 互 激活 模型 
(McClelland & Rumelhart, 1981) 影 响 极 大 ， 它 很 好 地 解决 了 目下 而 上 和 自 上 而 下 
的 信息 是 如 何 交 互 的 这 一 问题 。 该 模型 提出 的 交互 激活 框架 适用 于 大 部 分 认 知 
过 程 。 在 阅读 中 ， 只 有 将 从 视觉 中 获得 的 文字 信息 与 大 脑 中 存储 的 语言 知识 和 
世界 知识 进行 整合 后 才能 理解 语言 的 内 容 。 另 一 类 著名 的 词汇 加 工 模型 是 三 角 
模型 。 该 模型 利用 连接 主义 模型 的 思路 ， 假 定 词汇 的 正字 法 、 语 音 和 语义 信息 
均 采 用 分 布 式 表 征 ， 词 汇 加 工 通过 正字 法 、 语 音 和 语义 这 三 个 双向 连接 的 子 网 
络 实现 。 模 型 用 来 模拟 读者 利用 字形 信息 拼 出 词 的 读音 的 过 程 (Plaut et al., 1996; 
Seidenberg & McClelland, 1989)， 也 用 来 模拟 利用 字形 信息 通达 语义 的 过 程 
(Harm & Seidenberg, 2004)。 其 中 ，Plaut 等 人 (1996) 重 点 解决 读者 如 何 读 出 形 - 音 
对 应 不 规则 的 词 ， 他 们 认为 ， 无 论 是 规则 词 还 是 不 规则 词 ， 都 通过 一 种 类 似 神 
经 网 络 的 系统 提取 其 读音 ， 而 没有 单独 的 通路 。 在 这 个 模型 中 ， 系 统 关于 正字 
法 和 语音 之 间 映 射 关系 的 知识 被 编码 在 单元 间 的 加 权 连 接 中 ， 通 过 学 习 不 断 调 
整 连接 权重 。 该 学 习 过 程 受 到 训练 集 的 词 频 统计 规律 的 驱动 ， 能 够 捕捉 规则 与 
不 规则 之 间 的 连续 性 ， 并 在 其 内 部 表征 中 自然 地 反映 这 种 变化 ， 因 此 模糊 了 规 
则 词 和 不 规则 词 之 间 的 区 别 ， 使 得 模型 能 够 灵活 处 理 不 规则 输入 。Harm 和 
Seidenberg (2004) 利 用 三 角 模 型 ， 成 功 模 拟 了 英文 词汇 加 工 过 程 中 语音 中 介 通 路 
和 直接 语义 通路 的 分 工 合作 机 制 。 连 接 主义 模型 虽然 能 够 较 好 地 模拟 一 些 行为 
结果 ， 但 由 于 参数 较 多 ， 可 理解 性 不 高 。 

这 些 模型 在 理解 拼音 文字 的 认 知 机 制 方面 具有 重要 意义 ， 尤 其 是 在 帮助 人 
们 理解 从 字形 到 语音 的 转换 过 程 中 起 到 关键 作用 。 但 由 于 中 文 文字 与 拼音 文字 
具有 不 同 的 特点 ， 它 们 通常 难以 适用 于 中 文 。 在 拼音 文字 中 ， 字 母 对 应 音素 ， 
通过 音素 拼接 能 快速 获得 词 的 读音 ， 进 而 识别 词汇 和 通达 语义 (Tan & Perfetti, 
1997)。 然 而 ， 在 中 文 文字 中 ， 每 个 字 对 应 一 个 音节 ， 读 者 无 法 通过 偏旁 部 首 拼 
出 字音 ， 只 有 在 识别 整个 字 后 才能 得 到 读音 。 因 此 ， 有 学 者 认为 中 文 的 语义 通 
达 较 少 依赖 语音 中 介 通 路 (Perfetti et al., 2005). 

过 去 ， 学 者 们 围绕 中 文 阅读 构建 了 一 些 计算 模 型 ， 对 指导 中 文 阅读 的 研究 
起 到 了 非常 重要 的 作用 (Li et al., 2009; Li & Pollatsek, 2020; Perfetti et al., 2005; J. 


F. Yang et al., 2009)。 然 而 ， 已 有 的 中 文 阅读 模型 存在 如 下 问题 。 第 一 ， 大 部 分 
模型 集中 在 汉字 水 平 或 单字 词 水 平 (Perfetti et al., 2005; J. F. Yang et al., 2009)。 模 
型 引入 偏旁 部 首 和 汉字 的 表征 节点 ， 能 够 模拟 偏旁 部 首 的 特征 对 汉字 识别 时 间 
的 影响 及 字 频 效应 (e.g., Chang et al., 2016; Hsiao & Shillcock, 2004, 2005; Xing et 
al., 2002, 2004). Perfetti et al. (2005) 的 模型 虽然 进一步 引入 了 语义 和 语音 节点 ， 
实现 由 字形 到 语音 和 语义 的 输出 ， 但 仍 局 限于 单字 词 识别 。 然 而 ， 在 现代 汉语 
中 ， 由 两 个 或 两 个 以 上 的 字 构 成 的 多 字 词 占据 大 部 分 。 单 字 词 和 多 字 词 的 加 工 
机 制 存 在 差异 ， 多 字 词 的 识别 涉及 到 整体 还 是 分 解 加 工 的 问题 ， 如 果 是 分 解 加 
工 ， 则 需要 解释 如 何 从 单个 语素 的 意思 组 合 得 到 多 字 词 的 语义 ， 以 及 如 何 确定 
多 义 字 在 词 中 的 确切 语义 。 

第 二 ， 基 于 交互 激活 框架 ， 研 究 者 针对 中 文 多 字 词 加 工 提出 的 一 些 模型 框 
架 ， 意 在 解释 中 文字 词 识别 的 重要 发 现 (Peng et al., 1999; Taft & Nguyen-Hoan, 
2010; Tan & Perfetti, 1999)。Tan 和 Perfetti (1999) 的 视觉 词汇 识别 模型 包含 正字 
法 、 语 音 、 语 义 三 模块 ， 模 块 间 存在 交互 激活 ;同时 ， 在 正字 法 和 语音 信息 的 
加 工 模块 中 ， 都 存在 双向 连接 的 汉字 表征 和 多 字 词 表征 。 该 模型 假定 字 识 别 对 
多 字 词 识别 存在 促进 作用 ， 但 无 法 解释 一 些 研究 中 发 现 的 字 频 抑制 效应 。X. 
Zhou 和 Marslen-Wilson (2000) 提出 的 多 层级 词汇 加 工 框架 虽然 包含 了 形 、 音 、 
义 三 模块 ， 但 在 这 一 框架 中 ， 由 于 不 存在 独立 的 词 形 和 词 音 表示 ， 难 以 解释 中 
文 阅读 研究 里 广泛 发 现 的 基于 词 的 加 工 模式 ， 如 “ 词 优 效 应 ”等 (Chen et al., 
2018; Shen et al., 2018; J. M. Yang et al., 2012)。Peng 等 (1999) 的 模型 不 涉及 语音 
表征 ， 而 是 包含 正字 法 和 词汇 表征 两 个 系统 。 在 正字 法 系统 中 存储 字 ， 在 表征 
系统 中 存储 语素 和 词 。 正 字 法 层 的 字符 节点 通过 层级 间 连 接 激 活 表征 层 内 对 应 
的 语素 节点 和 词汇 节点 ， 连 接 强度 随 词 频 增 加 而 增强 。 在 词汇 表征 层 内 ， 语 义 
透明 词 的 语素 和 词汇 节点 之 间 为 激励 性 连接 ， 不 透明 词 的 语素 和 词汇 之 间 为 抑 
制 性 连接 。 该 模型 预测 词汇 语义 透明 度 和 整 词 词 频 同 时 调节 字 频 效应 ， 但 对 于 
语义 信息 何 时 开始 加 工 ， 及 其 与 词 形 表征 之 间 存 在 怎样 的 关系 尚 不 明确 。Taft 
和 Zhu (1997) 最 初 构建 的 中 文 多 字 词 加 工 框架 在 正字 法 、 语 音 和 语义 模块 均 包 
含 字 与 多 字 词 的 表征 。 在 更 新 后 的 框架 中 ，Tatft 等 (1999) 增 加 了 抽象 表征 的 词 
元 层 ， 连 接 正字 法 、 语 音 和 语义 ， 且 不 存在 整 词 的 正字 法 和 语音 表征 。 然 而 ， 


词 元 层 表 征 了 什么 信息 ， 以 及 语音 通路 在 中 文 多 字 词 加 工 中 的 作用 并 没有 清晰 
的 假设 。 

值得 注意 的 是 ， 以 上 基于 交互 激活 框架 提出 的 中 文 词 汇 加 工 模型 并 未 利用 
计算 机 程序 实现 ， 也 未 拟 合 实验 数据 。 严 格 地 讲 ， 这 些 框架 并 非 计 算 模型 ， 它 
们 无 法 模拟 字 词 加 工 复杂 的 动态 过 程 。 由 此 可 见 ， 多 字 词 的 加 工 机 制 是 理解 中 
文 词 汇 加 工 的 核心 问题 ， 但 是 目前 还 没有 一 个 正式 的 计算 模型 可 以 解决 该 问 


题 。 


第 三 ， 大 部 分 已 实现 的 词汇 模型 关注 了 字形 加 工 和 从 字形 到 语音 的 通路 ， 
但 较 少 涉及 多 字 词 语义 层面 的 加 工 (Xing et al., 2002, 2004; J. F. Yang et al., 2006, 
2009, 2013)。 考 虑 到 中 文中 复杂 的 字 词 关系 ， 词 汇 语义 加 工 仍 是 一 个 难题 。 而 
对 于 句子 阅读 中 的 词汇 加 工 ， 还 需要 解释 语 境 对 词汇 语义 通达 的 影响 。Li 和 
Pollatsek (2020) 提出 的 中 文 阅读 模型 (Chinese Reading Model, CRM) 模拟 了 句子 
加 工 过 程 中 词 切 分 、 词 识别 及 眼 动 控制 ， 其 中 也 包括 了 字 词 识别 的 过 程 。 该 模 
型 假设 当 眼 睛 注视 在 一 个 位 置 时 ， 所 有 能 感知 到 的 字 都 会 被 并 行 地 识别 出 来 。 
这 些 被 识别 出 来 的 字 组 成 的 词 都 会 被 激活 ， 而 这 些 被 激活 的 词 互 相 竞 争 ， 当 一 
个 词 在 竞争 中 取得 胜利 后 ， 这 个 词 就 被 识别 并 切 分 出 来 。 因 此 ， 这 个 模型 认为 
中 文 词 切 分 和 词 识别 是 同时 发 生 的 统一 的 过 程 。CRM 成 功 地 解释 了 中 文 阅读 过 
程 中 词 切 分 及 眼 动 控制 的 认 知 机 理 。 然 而 ， 值 得 注意 的 是 ，CRM 主要 关注 从 字 
形 到 词 条 的 加 工 ， 没 有 关注 语义 及 语音 的 作用 。 因 此 ， 该 模型 还 需要 进一步 完 
善 ， 以 解释 语音 和 语义 在 阅读 中 的 作用 。 

当前 中 文 词汇 加 工 的 认 知 模型 相关 的 研究 还 存在 一 些 咪 待 解决 的 问题 ， 缺 
乏 系统 的 词汇 语义 加 工 的 计算 模型 。 一 方面 ， 针 对 拼音 文字 提出 的 认 知 模型 难 
以 直接 应 用 于 中 文 ， 另 一 方面 ， 以 往 的 中 文 认 知 模型 或 者 关注 从 字形 到 语音 的 
加 工 ， 或 者 关注 字形 到 词 条 的 识别 ， 尚 未 有 模型 能 够 完整 地 描述 中 文 词汇 加 工 
过 程 中 形 、 音 、 义 的 动态 交互 。 此 外 ， 多 数 中 文 阅 读 模型 仅 关注 单字 词 的 加 
工 ， 缺 乏 对 多 字 词 加 工 过 程 的 模拟 。 这 些 模型 的 局 限 限 制 了 其 应 用 范围 。 
3 问题 提出 

本 研究 关注 中 文 词汇 语义 加 工 ， 拟 采用 计算 建 模 方 法 探究 其 认 知 机 各 
通过 实验 验证 理论 假设 。 有 具体 将 围绕 以 下 三 个 核心 问题 展开 : 

第 一 ， 从 整体 与 局 部 竞争 的 视角 ， 探 讨 中 文 复合 词 加 工 中 单字 词 是 否 激活 
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并 与 整 词 竞争 ， 进 而 解释 语素 加 工 和 复合 词 加 工 之 间 的 关系 。 大 部 分 的 中 文 多 
字 词 都 是 复合 词 ， 由 两 个 或 多 个 语素 组 成 。 以 往 研究 尝试 区 分 整体 或 分 解 加 工 
的 理论 ， 然 而 这 些 理论 均 有 很 多 无 法 解释 的 研究 结果 。 本 研究 则 在 提出 并 通过 
模型 验证 一 种 新 的 理论 假设 ， 即 在 复合 词 加 工 过 程 中 ， 局 部 单字 词 和 整 词 表征 
在 视觉 词汇 、 语 音 词汇 以 及 语义 层面 都 被 激活 ， 并 互相 竞争 ， 竞 争取 胜 的 词 被 
识别 。 

第 二 ， 探 讨 阅读 中 词汇 的 语音 中 介 通 路 与 直接 语义 通路 的 分 工 。 中 文 是 表 
意 文 字 ， 与 拼音 文字 的 拼 读 机 制 不 同 ， 在 形 、 音 、 义 的 加 工 机 制 也 存在 不 同 。 
以 往 有 关中 文字 词 识别 的 模型 仅 考虑 了 单字 词 的 加 工 ， 尚 未 解决 多 字 词 加 工 过 
程 中 语音 通路 的 问题 。 但 多 字 词 与 单字 词 的 加 工 存在 差异 ， 中 文 同音 字 较 多 
(平均 每 个 汉字 有 4 个 同音 字 )， 通 过 单字 词 的 读音 会 通达 多 个 语义 ， 因 此 语音 
中 介 通 路 的 效率 较 低 。 然 而 ， 多 字 词 的 同音 现象 较 少 ， 可 以 更 容易 地 通过 语音 
激活 相应 的 语义 单元 ， 因 此 更 有 可 能 通过 语音 中 介 通 达 语 义 。 本 研究 将 着 重 探 
究 多 字 词 加 工时 ， 语 音 中 介 通 路 与 直接 语义 通路 交互 协作 ， 从 而 通达 语义 的 认 
知 计算 过 程 。 拟 通过 建 模 的 方法 ， 研 究 在 中 文 词汇 加 工 过 程 中 ， 形 、 音 、 义 是 
如 何 动态 激活 的 ， 并 重点 探讨 这 些 加 工 的 认 知 框架 及 认 知 过 程 如 何 实现 。 特 别 
关注 中 文 阅 读 过 程 中 如 何 激活 语音 信息 ， 激 活 的 语音 信息 是 否 能 够 通达 语义 ， 
以 及 语音 中 介 通 路 和 直接 语义 通路 之 间 的 关系 等 具体 研究 问题 。 

第 三 ， 从 句子 阅读 的 视角 ， 探 讨 语 境 影 响 词汇 语义 加 工 的 认 知 机 制 。 当 前 
探讨 词汇 加 工 机 制 的 研究 及 模型 极 少 考虑 句子 语 境 的 影响 。 在 句子 阅读 时 ， 词 
汇 的 加 工 往往 受到 语 境 的 影响 。 本 研究 将 探讨 如 何 建立 模型 、 采 用 怎样 的 假 
设 ， 以 模拟 句子 阅读 中 语 境 影响 词汇 语义 加 工 的 研究 发 现 ， 包 括 语 境 影响 多 义 
词 的 理解 ， 语 境 影 响 词 切 分 ， 以 及 通过 语 境 预测 下 一 个 词 。 重 点 考察 如 下 两 种 
假定 的 加 工 方式 能 否 模拟 语 境 影 响 词汇 加 工 的 认 知 过 程 : 第 一 、 在 看 到 目标 词 
之 前 ， 根 据 语 境 信息 预先 激活 一 些 词 的 语义 表征 ， 从 而 影响 目标 词 的 加 工 ; 第 
二 、 在 看 到 目标 词 之 后 ， 前 文 语 境 通过 影响 不 同 语义 表征 的 竞争 优势 来 影响 词 
汇 加 工 。 值 得 注意 的 是 ， 这 两 种 假设 并 不 互 斥 。 在 建 模 过 程 中 ， 模 型 将 使 用 某 
一 种 或 同时 使 用 这 两 种 机 制 来 实现 对 不 同 任务 的 模拟 。 

综 上 ， 中 文 词汇 加 工 是 一 个 复杂 的 认 知 过 程 。 本 研究 围绕 该 问题 从 词汇 加 
工 的 不 同 视角 出 发 ， 采 用 不 同 技术 方法 展开 ， 共 包含 四 个 部 分 。 第 一 部 分 通过 
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元 分 析 全 面 梳理 中 文 词汇 加 工 机 制 研究 的 现 有 成 果 ， 从 整体 上 理解 已 有 研究 
的 结果 和 结论 ， 发 现 不 同 研究 结果 的 潜在 影响 因素 ， 并 提出 理论 假设 。 基 于 
这 些 假设 ， 第 二 部 分 拟 建 立 计算 模型 模拟 中 文 孤立 词 的 语义 加 工 过 程 。 该 模 
型 能 够 模拟 词汇 加 工 过 程 中 形 、 音 、 义 激活 的 动态 过 程 ， 并 能 够 拟 合 经 典 的 
研究 发 现 。 通 过 暂时 忽略 语 境 对 词汇 加 工 的 影响 ， 可 以 将 模型 的 复杂 性 维持 
在 可 控 范 围 内 。 在 此 基础 上 ， 第 三 部 分 将 建立 能 够 模拟 句子 阅读 过 程 中 词汇 
语义 加 工 的 计算 模型 ， 重 点 解决 句子 加 工 过 程 中 词汇 加 工 出 现 的 问题 ， 并 阐 
明 以 往 孤 立 词 与 句子 阅读 研究 结果 不 一 致 的 原因 。 第 四 部 分 拟 设计 实验 对 模 
型 中 的 一 些 重要 假设 进行 验证 ， 重 点 验证 模型 在 复合 词 加 工 过 程 中 提出 的 单 
字 词 与 整 词 的 竞争 机 制 等 核心 假设 。 实 验 结果 将 帮助 我 们 进一步 修正 模型 ， 
并 通过 逐步 迭代 优化 计算 模型 ， 从 而 更 好 地 理解 中 文 阅读 词汇 语义 加 工 认 知 
机 制 |。 
4 研究 构想 

本 研究 聚焦 中 文 词汇 语义 加 工 ， 采 用 元 分 析 、 计 算 建 模 与 实验 研究 等 方 
法 ， 从 复合 词 整体 与 局 部 加 工 、 词 汇 形 音义 模块 交互 、 句 子 阅 读 中 的 词汇 加 
工 等 视角 开展 研究 。 本 研究 则 在 创新 理论 假设 ， 构 建 中 文 特有 的 词汇 语义 加 
工 计算 模型 ， 并 通过 实验 验证 。 此 工作 将 揭示 中 文 词汇 语义 加 工 的 动态 过 
程 ， 包 括 单独 呈现 和 句子 中 的 词汇 加 工 ， 以 前 明 中 文 阅 读 的 特异 性 认 知 机 
制 。 研 究 将 按 以 下 四 个 部 分 展开 ， 总 体 框架 见 图 


— 
m 


研究 一 : 中 文 词汇 加 工 研究 的 元 分 析 


分 析 语 素 、 语 音 和 语 境 在 中 文 复合 词 加 
工 已 有 研究 中 的 效应 


科学 问题 一 


研究 二 : 孤立 词 加 工 模型 复合 词 加 工 机 制 研究 三 : 句子 阅读 中 词 的 
构建 与 模拟 语义 加 工 过 程 模拟 
科学 问题 二 
搭建 模型 结构 、 实 现 各 模 语音 通路 的 作用 模拟 词汇 及 句子 语义 加 工 
块 表征 与 连接 、 开 展 模型 对 眼 动 控制 的 影响 ， 拟 合 
实验 和 使 用 模型 拟 合 数据 = 中 文 阅读 的 重要 数据 模式 
科学 问题 三 
语 境 对 词汇 语义 加 工 的 影响 


研究 四 : 实验 验证 模型 假设 及 预测 


实验 1: 孤立 词 加 工时 的 竞争 机 制 
实验 2: 句子 阅读 中 词汇 加 工 的 竞争 机 制 


图 1 本 研究 框架 图 
4.1 中 文 词汇 加 工 研究 的 元 分 析 


研究 一 围绕 三 个 核心 科学 问题 对 以 往 中 文 复合 词 加 工 研 究 分 别 进行 元 分 


析 ， 估 计 语 素 、 语 音 和 语 境 在 复合 词 加 工 中 的 效应 量 大 小 ， 检 验 以 往 研究 结果 
的 可 靠 性 。 三 项 元 分 析 流 程 相似 ， 具 体 实验 研究 纳入 标准 与 编码 规则 不 同 。 

在 考察 语素 加 工 对 复合 词 识别 的 影响 的 元 分 析 中 ， 样 本 包含 所 有 操纵 复合 
词语 素 特征 的 实验 研究 ， 将 操纵 语素 激活 较 强 的 条 件 作 为 实验 组 ， 语 素 激 活 较 
弱 条 件 作为 控制 组 。 首 先 对 所 有 纳入 的 研究 进行 编码 ， 估 计 总 体 效 应 大 小 ， 假 
如 语素 激活 对 复合 词 识别 有 影响 ， 预 期 观察 到 显赫 的 总 体 效 应 量 ， 并 且 效 应 量 
大 小 反映 语素 对 词汇 加 工 的 实际 影响 程度 。 随 后 分 析 已 有 研究 结果 之 间 的 差异 
及 可 能 来 源 ， 使 用 加 权 回 归 检 验 各 潜在 调节 变量 ， 包 括 刺激 呈现 方式 、 操 纵 的 
语素 特征 和 词 频 ， 并 检验 是 否 存在 发 表 偶 倚 。 预 期 均 存在 调节 效应 : 1) 目标 词 
单独 呈现 时 ， 比 嵌入 在 句子 中 呈现 存在 更 大 的 语素 效应 ，2) 操纵 语素 语义 特 
征 ， 比 操纵 语素 语音 或 正字 法 特征 会 产生 更 大 的 语素 效应 ; 3) 加 工 低 词 频 目标 
词 比 高 词 频 目 标 词 会 产生 更 大 的 语素 效应 。 根 据 元 分 析 中 估计 所 得 总 体 效 应 
量 ， 选 取 单 个 实验 效应 量 最 接近 整体 的 实验 研究 作为 代表 性 研究 ， 供 后 续 模 型 
拟 合 。 

在 考察 词汇 加 工 中 的 语音 效应 及 是 否 通过 语音 中 介 通 路 通达 语义 的 元 分 析 
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中 ， 纳 入 以 语音 特征 为 自 变 量 且 实验 任务 包含 视觉 词汇 加 工 的 所 有 实验 研究 。 
将 语音 相关 条 件 作为 实验 组 ， 语 音 无 关 条 件 作为 控制 组 。 分 析 的 潜在 调节 变量 
为 实验 范式 、 实 验 任务 、 加 工整 体 或 部 分 语音 、 词 频 和 被 试 年 龄 等 可 能 导致 异 
质 性 的 因素 。 若 语 首 效 应 的 总 体 效应 量 显著 ， 则 支持 词汇 加 工 中 激活 了 语音 信 
息 。 假 设 当 实验 任务 为 语义 加 工时 ， 存 在 显著 的 语音 效应 且 方 同 为 促进 ， 则 说 
明 词汇 语义 加 工 中 使 用 语音 中 介 通 路 。 反 之 ， 大 在 调节 变量 的 茶 个 水 平 无 明显 
语音 效应 ， 则 说 明 语音 激活 及 产生 的 影响 较 弱 。 

最 后 ， 对 词汇 加 工 中 的 语 境 效应 进行 元 分 析 。 纳 入 操纵 语 境 特 征 或 目标 词 
与 语 境 之 间 关 系 的 实验 研究 。 编 码 时 将 相对 有 利 语 境 条 件 作 为 实验 组 ， 相 对 不 
利 或 中 性 语 境 条 件 作为 控制 组 ， 估 计 总 体 效 应 大 小 。 预 期 语 境 对 词汇 加 工 产生 
重要 影响 ， 表 现 为 较 大 的 总 体 效 应 量 。 潜 在 调节 变量 包括 实验 操纵 变量 、 实 验 
任务 、 刺 激 呈 现 方式 、 呈 现时 间 和 被 试 年 龄 等 。 根 据 元 回归 结果 及 不 同 变量 水 
平 下 效应 量 大 小 差异 ， 找 出 语 境 影 响 词汇 加 工 的 主要 内 部 因素 ， 如 在 什么 条 件 
下 语 境 会 对 词汇 加 工 产生 更 大 的 影响 。 元 分 析 的 结果 为 句子 阅读 过 程 中 词 的 语 
义 加 工 模型 提供 理论 假设 和 数据 支撑 。 

4.2 中 文 孤 立 词 加 工 模型 构建 

研究 二 采用 模型 仿真 的 方法 ， 从 整体 与 局 部 竞争 和 模块 加 工 的 视角 ， 探 讨 
中 文 阅 读 中 从 字形 通达 语义 的 动态 加 工 过 程 。 本 研究 旨 在 构建 中 文 孤 立 词 加 工 
的 计算 模型 ， 探 讨 词汇 语义 加 工 中 语素 语义 和 语音 通路 的 作用 。 

4.2.1 模型 假设 

中 文 扳 立 词语 义 加 工 模型 的 构建 包含 两 个 重要 假设 。 第 一 ， 模 型 假设 视觉 
词汇 语义 加 工 中 激活 语音 的 表征 ， 因 此 模型 包含 字形 、 语 音 和 语义 三 个 模块 ， 
且 模 块 间 具有 前 馈 和 反馈 连接 。 这 意味 着 词汇 加 工时 ， 字 形 到 语义 的 直接 通路 
和 字形 经 过 语音 中 介 再 到 语义 的 通路 都 会 被 激活 。 模 型 实验 部 分 将 对 这 一 假设 
进行 验证 。 

第 二 ， 加 工 复合 词 时 ， 模 型 假定 在 字形 、 语 音 和 语义 层次 上 ， 骨 套 的 单字 
词 和 复合 词 整 词 均 被 激活 ， 并 且 二 者 存在 竞争 关系 。 由 于 竞争 ， 单 字 词 的 激活 
对 整 词 激活 产生 抑制 效应 。 不 同 于 以 往 大 多 采用 整体 或 分 解 加 工 假设 的 模型 ， 
在 该 模型 中 ， 单 字 词 和 整 词 表征 位 于 同一 层 且 同时 被 激活 ， 形 、 音 、 义 多 个 层 
次 上 竞争 的 结果 决定 完 竟 是 整 词 取胜 还 是 单字 词 取 胜 。 模 型 实验 中 ， 不 同 节点 
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的 激活 程度 随时 间 动 态 变化 ， 变 化 模式 将 检验 该 假设 。 
4.2.2 模型 结构 与 实现 

模型 在 整体 上 具有 完整 的 三 角 结构 ， 分 为 字形 、 语 音 和 语义 模块 ， 同 时 使 
用 层次 网 络 结构 ， 以 节点 表征 字形 、 字 音 、 词 条 、 词 的 各 个 读音 和 单字 词 、 多 
字 词 的 各 个 语义 〈 如 图 2)。 模 块 间 和 模块 内 基于 交互 激活 模型 的 表征 方式 来 实 
现 自 下 而 上 与 自 上 而 下 信息 交互 。 模 型 的 基本 假设 体现 在 模块 间 及 各 模块 内 节 
点 间 的 连接 方式 和 强度 上 。 模 型 输入 为 字 词 视觉 信息 ， 输 出 为 识别 出 的 词 条 、 
词义 和 词 的 读音 ， 从 输入 到 输出 通过 循环 更 新 节点 激活 度 ， 能 够 模拟 中 文 词 汇 
加 工 的 动态 过 程 。 


语义 模块 


图 2 中 文 阅读 字 词 加 工 计算 模型 框架 图 

在 模型 实现 方面 ， 视 觉 层 、 汉 字 层 和 词 条 层 的 实现 方式 与 CRM 一 致 。 语 
音 层 的 激活 通过 字形 单元 激活 超过 阐 值 后 激活 对 应 字符 的 语音 节点 来 实现 ， 进 
而 激活 所 有 相关 的 词汇 语音 单元 。 在 语义 层 ， 假 设 语义 信息 以 语义 空间 的 形式 
表征 ， 相 关 性 高 的 词 距离 近 。 一 个 词 的 语义 信息 被 表征 为 一 组 被 激活 的 语义 单 
元 (Landauer & Dumais, 1997)。 词 激活 超 闪 值 时 ， 激 活 对 应 语义 空间 小 区 域 及 其 
中 所 有 语义 单元 。 小 空间 中 心 的 单元 激活 程度 最 高 ， 而 距离 中 心 位 置 较 远 的 单 
元 激活 程度 较 低 。 语 义 空间 信息 的 获取 将 采用 词 散 入 的 方法 ， 利 用 wordVec Tii 
训练 (Mikolov et al., 2013) 得 到 每 个 词 的 200 维 向 量 表示 ， 通 过 余弦 相似 度 计 算 词 
间 语 义 距离 。 

模型 假设 邻近 层 以 交互 激活 方式 连接 ， 非 邻近 层 无 直 连 。 此 交互 连接 赋予 
模型 新 特性 。 以 语音 通路 为 例 ， 中 文 多 音字 和 同音 字 众 多 ， 因 此 单字 模型 难以 


确定 多 音字 发 音 或 直接 由 语音 通达 语义 。 本 模型 加 工 多 字 词 语音 为 交互 过 程 ， 
可 通过 反馈 连接 确定 多 音字 读音 ， 多 字 词 同音 较 少 ， 更 易 激活 准确 语义 ， 提 高 
音 中 介 通 达 语义 的 效率 。 这 些 特点 是 单字 词 模型 所 不 具备 的 。 
4.2.3 模型 实验 

模型 完成 后 ， 将 通过 调整 结构 和 参数 ， 考 察 其 特性 ， 以 揭示 词汇 加 工 的 认 
知 机 制 。 同 时 ， 研 究 将 通过 模拟 实验 考察 模型 假设 是 否 能 够 解释 已 有 重要 发 
现 。 检 验 语音 加 工 通路 的 作用 时 ， 通 过 改变 模型 参数 调节 两 条 通路 的 分 工 。 依 
据 不 同 参数 ， 模 型 可 以 仅 通 过 直接 语义 通路 或 仅 通 过 语音 中 介 通 路 激活 语义 ， 
也 可 以 通过 两 条 通路 合力 激活 语义 。 在 建 模 过 程 中 ， 将 探讨 哪 种 方式 可 以 更 好 
地 拟 合 研究 发 现 ， 从 而 确定 最 终 的 模型 结构 。 另 外 ， 还 将 测试 移 除 模 型 某 个 部 
分 对 模型 行为 的 影响 ， 考 察 在 完全 不 使 用 语音 中 介 通 路 时 ， 是 否 有 一 些 实验 发 
现 无 法 拟 合 。 假 如 存在 无 法 拟 合 的 情况 ， 将 为 语音 中 介 通 路 的 必要 性 提供 较 强 
的 支持 证 据 。 此 外 ， 在 模拟 实验 中 观察 语音 、 语 义 单 元 激活 时 序 ， 比 较 不 同 加 
工 单元 的 激活 动态 ， 为 理解 词汇 语义 加 工 不 同 通路 的 时 间 进 程 提供 新 思路 。 

模型 将 模拟 中 文 孤立 词 加 工 ， 评 估 基 于 竞争 机 制 构 建 的 模型 对 中 文 阅 读 研 
究 发 现 的 模拟 效果 。 拟 合 包括 : CD) 复合 词 加 工 中 字 的 属性 〈 如 语义 透明 度 ) 
对 加 工 速度 的 影响 ，(2) 语音 加 工 相关 研究 ， 探 究 语音 激活 及 其 在 词汇 加 工 中 
的 作用 ， 特 别 是 多 音字 读音 的 确定 ; (3) 模拟 语义 启动 效应 ， 包 括 整 词语 义 和 
语素 语义 启动 效应 。 这 些 拟 合 则 在 评估 模型 效果 ， 揭 示 模 型 结构 对 相关 效应 产 
生 的 影响 ， 深 化 对 认 知 机 制 的 理解 。 
4.3 句子 阅读 过 程 中 词 的 语义 加 工 过 程 模拟 
4.3.1 模型 假设 

研究 三 将 整合 研究 二 构建 的 孤立 词 加 工 模型 和 CRM 模型 中 眼 动 控制 模 
块 ， 考 虑 语音 加 工 、 语 义 加 工 和 句子 语 境 的 影响 ， 加 入 新 的 假设 ， 构 建 句 子 阅 
读 过 程 中 词 的 语义 加 工 模 型 ， 以 准确 模拟 句子 阅读 中 的 词汇 加 工 过 程 ， 及 其 与 
眼 动 控制 的 关系 。 阅 读 的 目的 是 理解 文本 语义 ， 因 此 ， 不 同 于 CRM 假设 视觉 
词汇 加 工程 度 是 决定 眼睛 何 时 移动 的 主要 因素 ， 新 假设 认为 语义 单元 激活 程度 
是 决定 眼 跳 时 机 的 主要 因素 。 这 一 假设 将 有 助 于 更 准确 地 模拟 读者 在 句子 阅读 
中 的 词汇 加 工 过 程 ， 从 而 更 好 地 解释 与 语义 加 工 相关 的 重要 研究 发 现 。 模 型 的 
另 一 个 重要 假设 是 已 识别 词 对 后 续 词 的 加 工 产生 影响 。 在 一 个 词 的 语义 被 提取 
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出 来 后 ， 构 成 该 词义 的 语义 单元 将 保持 最 高 激活 ， 不 受 其 他 正在 加 工 的 词 影 
响 ， 同 时 影响 后 续 词 加 工 。 通 过 调整 语义 单元 间 连 接 强度 ， 可 以 模拟 语 境 对 多 
义 词 选择 的 影响 。 
4.3.1 模型 实验 

本 研究 拟 使 用 新 构建 的 模型 模拟 如 下 重要 实验 发 现 : CIO 预 视 效应 ， 研 究 
通常 利用 边界 范式 ， 探 究 预 视 词 与 目标 词 的 语义 相关 性 对 注视 时 间 的 影响 ， 结 
果 证 明 读 者 在 注视 之 前 已 经 加 工 到 词汇 语义 信息 。 这 种 现象 对 了 解 在 一 个 注视 
点 上 能 够 加 工 的 信息 量 以 及 词 是 并 行 还 是 串 行 加 工具 有 重要 意义 。(2) 多 义 词 
的 语义 选择 。 模 拟 Shen 和 Li(2016) 的 研究 结果 ， 探 究 语 境 如 何 影响 多 义 词 语义 
选择 ， 显 示 读 者 如 何 实时 利用 语 境 信息 选择 最 合适 的 词义 。(3) 词 的 预测 性 效 
应 。 当 读者 能 够 利用 语 境 信息 预测 出 下 一 个 词 时 ， 在 这 个 词 上 的 阅读 时 间 将 变 
短 (Rayner et al, 2005)。 该 现象 说 明 语 境 信息 对 词义 理解 具有 预测 功能 ， 是 检验 
模型 有 效 性 的 一 个 重要 指标 。(4) 符 套 词 优先 整体 加 工 。 模 拟 中 文 读 者 如 何 整 
体 加 工 嵌 套 词 并 与 语 境 整合 ， 例 如 句子 阅读 中 “老板 娘 ” 的 加 工 不 受 “ 老 板 "在 语 
境 中 的 合理 性 的 影响 (J. M. Yang et al., 2012; J. Zhou & Li, 2021)。 这 些 结果 对 理 
解 句 子 阅 读 时 词汇 加 工 与 整合 的 单元 具有 重要 意义 。 假 如 模型 的 假设 正确 ， 模 
型 应 该 能 够 拟 合 以 上 关键 数据 模式 ， 和 否则 需要 进一步 修正 。 
4.4 实验 验证 模型 的 核心 假设 及 重要 预测 

本 研究 计划 使 用 实验 研究 来 验证 模型 的 重要 假设 和 预测 。 其 中 ， 我 们 将 重 
点 验证 模型 在 复合 词 加 工 过 程 中 提出 的 单字 词 与 整 词 的 竞争 机 制 ， 在 两 个 实验 
中 分 别 考察 加 工 孤 立 词 和 嵌入 在 句子 中 的 复合 词 时 是 否 存在 部 分 单字 词 与 整体 
多 字 词 的 竞争 。 假 如 模型 的 假设 和 预测 得 到 验证 ， 将 对 模型 提供 实证 支持 ， 并 
可 以 加 深 我 们 对 中 文 词汇 加 工 的 理解 。 假 如 实验 结果 与 模型 的 假设 和 预测 不 
符 ， 将 需要 对 模型 进行 修正 。 通 过 这 个 过 程 ， 可 以 螺旋 式 地 提升 我 们 对 中 文 词 
汇 加 工 认 知 机 制 的 理解 。 
4.4.1 孤立 词 加 工 中 的 竞争 机 制 

实验 1 拟 验证 孤立 词 加 工 模型 的 一 个 重要 假设 : 在 复合 词 加 工 过 程 中 ， 整 
词 和 髓 套 的 单字 词 都 会 被 激活 ， 并 互相 竞争 。 拟 采用 2 〈 整 词 词 频 : 高 频 和 低 
频 ) x2 〈 单 字 词 词 频 : 高 频 和 低频 ) 被 试 内 实验 设计 。 实 验 操纵 的 单字 词 词 频 
是 指 构成 复合 词 的 第 一 个 字 在 语料库 中 作为 单字 词 出 现时 的 词 频 。 中 文 单字 词 
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同时 具有 字 频 与 词 频 特征 ， 二 者 高 度 相关 但 表示 不 同 含义 。 以 “ 树 ” 为 例 ， 字 
频 表 示 “ 树 ”这 个 字 在 语料库 所 有 字 里 的 出 现 频率 ， 包 括 “ 树 ”“ 树 立 ”“ 大 
树 ” 等 任何 形式 ， 而 词 频 仅 包含 “ 树 ” 作 为 单字 词 时 ， 在 所 有 词 里 的 出 现 频 
率 。 以 往 研究 关注 字 频 对 复合 词 加 工 的 影响 ， 由 于 未 考虑 词 频 的 潜在 影响 ， 在 
操纵 字 频 的 同时 存在 词 频 的 干扰 。 本 实验 的 目标 是 检验 模型 关于 词汇 水 平 单字 
词 与 整 词 之 间 存 在 竞争 的 假设 ， 因 此 操纵 单字 词 词 频 ， 同 时 匹配 字 频 特征 。 实 
验 中 ， 中 文 二 字 复 合 词 孤立 呈现 ， 被 试 对 每 个 出 现 的 刺激 进行 词汇 决定 任务 ， 
实验 将 记录 被 试 对 每 个 刺激 做 出 的 按键 反应 和 反应 时 间 。 根 据 模型 的 竞争 假 
说 ， 单 字 词 和 多 字 词 之 间 存 在 词汇 水 平 的 竞争 。 若 符合 这 一 假说 ， 预 期 单字 词 
词 频 越 高 ， 二 字 词 的 词汇 判断 所 需 时 间 越 长 ， 词 汇 加 工 速度 越 慢 。 同 时 ， 存 在 
整 词 词 频 和 单字 词 词 频 的 交互 效应 ， 在 整 词 低频 时 ， 单 字 词 词 频 的 抑制 效应 影 
响 更 大 。 若 不 存在 词汇 水 平 的 竞争 ， 预 期 单字 词 词 频 的 变化 对 词汇 加 工 反 应 时 
无 明显 影响 。 
4.4.2 句子 中 词汇 加 工 的 竞争 机 制 

实验 2 考察 句子 中 词汇 的 加 工 机 制 ， 采 用 2 (单字 词 与 整 词语 义 相 似 度 : 
高 相似 和 低 相 似 ) x2 〈 单 字 词 词 频 : 高 频 和 低频 ) 被 试 内 实验 设计 。 研 究 将 检 
验 在 加 工 句 子 中 的 多 字 词 时 ， 和 内 套 的 单字 词 是 否 会 被 激活 并 与 整 词 产生 竞争 。 
如 果 存 在 竞争 ， 竞 争 发 生 在 正字 法 还 是 语义 水 平 。 目 标 词 为 中 文 二 字 复 合 词 ， 
同一 组 的 四 个 目标 词 租 入 在 相同 的 句子 框架 中 ， 被 试 阅读 理解 句子 ， 并 记录 有 眼 
动 轨迹 。 拟 通过 比较 目标 词 上 的 注视 时 间 ， 来 考察 读者 在 词汇 加 工时 是 否 受 到 
复合 词 成 分 与 整体 语义 相似 度 和 单字 词 词 频 的 影响 。 若 符合 竞争 假说 ， 预 期 发 
现 单字 词 词 频 的 抑制 效应 ， 即 在 高 词 频 条 件 下 ， 注 视 时 间 更 长 。 反 之 ， 若 由 于 
句子 语 境 提供 了 自 上 而 下 的 激活 ， 读 者 对 词汇 的 加 工 较 少 依赖 单个 字 的 表征 ， 
预期 不 存在 单字 词 的 词 频 效 应 。 知 句子 中 的 复合 词 加 工 存在 语义 水 平 的 竞争 ， 
预期 仅 当 单字 词 与 整 词语 义 相似 度 较 低 的 情况 下 ， 存 在 单字 词 词 频 抑制 效应 ， 
表现 为 包含 高 词 频 成 分 的 复合 词 加 工时 间 更 长 。 
5 理论 建构 

词汇 加 工 是 阅读 理解 的 基础 ， 但 由 于 中 文书 写 系统 的 特异 性 ， 单 个 汉字 具 
有 丰富 的 语义 信息 ， 基 于 字母 语言 提出 的 词汇 加 工 模型 很 难 直 接应 用 于 中 文 词 
汇 加 工 (Li et al., 2022)。 部 分 中 文 词汇 加 工 模型 仅 针 对 单字 词 的 加 工 问 题 ， 模 型 
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引入 偏旁 部 首 和 汉字 的 表征 节点 ， 能 够 模拟 偏旁 部 首 的 特征 对 汉字 识别 时 间 的 
影响 及 字 频 效应 (Chang et al., 2016; Hsiao & Shillcock, 2004, 2005; Xing et al., 
2002, 2004; J. F. Yang et al., 2006, 2009, 2013)。 另 外 一 些 针 对 中 文 多 字 词 加 工 提 
出 的 模型 强调 了 字 识 别 与 词 识别 之 间 的 交互 激活 ， 但 并 未 涉及 到 语音 和 语义 加 
工 (Li & Pollatsek, 2020; Yu et al., 2021); 或 尚未 通过 计算 建 模 实现 ， 难 以 模拟 词 
汇 加 工 的 动态 过 程 Peng et al., 1999; Taft et al., 1999; Taft & Zhu, 1997)。 尽 管 现 
有 的 模型 提供 了 对 中 文字 词 识别 和 阅读 过 程 的 深入 理解 ， 但 仍 有 许多 挑战 和 问 
题 需要 解决 。 例 如 ， 中 文 里 存在 大 量 复合 词 ， 仅 依赖 拼接 单字 词 的 语音 和 语义 
难以 准确 加 工 复合 词 。 本 研究 聚焦 中 文 词 汇 语义 加 工 三 个 关键 科学 问题 ， 提 出 
原创 性 中 文 词汇 语义 加 工 理 论 假 设 ， 在 语音 和 语义 层次 扩展 已 经 建立 的 中 文 阅 
读 模型 (Li & Pollatsek, 2020)， 分 别 建立 孤立 词 加 工 和 句子 中 词汇 加 工 两 个 认 
知 计算 模型 ， 并 设计 实验 验证 其 假设 和 预期 。 本 研究 具有 以 下 理论 意义 。 

首先 ， 针 对 中 文 复合 词 的 加 工 机 制 问题 ， 已 有 研究 在 “ 词 是 以 整体 进行 加 工 
的 "和 “ 词 是 以 分 解 通 路 进行 加 工 的 ”这 两 种 观点 之 间 和 争论 (Cao et al., 2016; Taft et 
al., 1994; Tsang & Chen, 2014; G. Yan et al., 2006)。 本 研究 提出 一 种 新 的 可 能 性 : 
在 词 形 和 词义 的 层次 上 ， 知 觉 广度 内 所 有 字 能 够 组 成 的 词 都 会 被 激活 并 相互 竞 
争 ， 包 括 单字 词 和 多 字 词 。 例 如 ， 读 者 看 到 “树立 ”两 个 字 时 ,“ 树 ”“ 立 ”和 *“ 树 
立 ” 这 三 个 词 的 词 形 在 词汇 层 都 会 被 激活 ， 且 相互 竞争 ， 最 终 取 得 竞争 胜利 的 词 
被 切 分 为 词 ， 并 被 识别 。 类 似 的 ， 多 字 词 及 包含 的 单字 词 在 语义 层 也 都 会 被 激 
活 和 竞争 ， 一 端 激活 程度 的 上 升 将 减少 另 一 端的 激活 ， 最 终 激 活 程度 相对 较 高 
且 最 早 超过 闵 限 的 词 优先 通达 语义 。 这 种 理论 在 已 有 研究 中 未 见报 道 。 本 研究 
为 复合 词 加 工 提出 了 一 种 新 的 理论 假设 ， 有 望 推 动 中文 词 汇 认 知 加 工 机 制 的 研 
究 取 得 重大 进展 。 

第 二 ， 本 研究 建立 的 模型 能 够 模拟 词汇 加 工 过 程 中 形 、 音 、 义 的 交互 作 
用 ， 揭 示 语 义 直 接 通路 和 语音 中 介 通 路 在 中 文 词 汇 加 工 中 的 分 工 及 功能 。 以 往 
研究 中 基于 单字 词 的 模型 认为 中 文 语义 通达 较 少 依赖 语音 中 介 ， 原 因 之 一 是 大 
量 同 音字 降低 了 语义 通达 效率 (Wong et al., 2014; H. Zhang et al., 2020; X. L. Zhou 
etal., 1999)。 然 而 ， 占 据 中 文 词汇 大 多 数 的 多 字 词 很 少 出 现 语音 歧义 的 现象 ， 
因此 可 以 更 容易 地 激活 相应 的 语义 单元 。 多 字 词 的 加 工 机 制 与 单字 词 不 同 ， 更 
有 可 能 通过 语音 中 介 通 达 语 义 。 本 模型 包含 语音 模块 ， 当 字形 单元 激活 程度 超 
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过 阔 值 后 ， 语 音 层 内 相应 的 语音 单元 及 所 有 相关 的 词汇 语音 单元 都 被 激活 。 多 
字 词 语音 加 工 是 一 个 交互 过 程 ， 相 比 于 仅 能 加 工 单字 词 的 模型 ， 该 模型 可 以 通 
过 自 上 而 下 的 连接 ， 确 定 多 音字 的 正确 读音 。 例 如 “长 ”单独 呈现 时 ， 无 法 确定 
究竟 读 “ching” 还 是 “zhing”， 但 “成 长 "里 的 “长 "可 以 确定 语音 为 “zhing”。 这 些 特 
性 是 以 往 的 单字 词 模型 中 不 存在 的 。 本 模型 充分 考虑 形 、 音 、 义 三 模块 在 多 字 
词 词 汇 加 工 中 的 动态 交互 ， 从 不 同 加 工 通 路 协调 与 分 工 的 角度 解释 中 文 词汇 加 
工 机 制 。 这 有 助 于 完善 现 有 词汇 加 工 理论 ， 进 而 比较 各 类 语言 加 工 机 制 的 普遍 
性 与 特异 性 。 

第 三 ， 本 研究 建立 句子 阅读 过 程 中 词汇 语义 加 工 的 计算 模型 ， 充 分 考虑 名 
子 语 境 对 词汇 通达 及 眼 动 控制 的 影响 。 目 前 基于 中 文 阅读 中 的 词汇 加 工 开 发 的 
计算 模型 较 少 ， 仅 有 的 一 些 模型 也 仅仅 聚焦 于 词 切 分 和 词 识别 问题 ， 未 涉及 语 
义 加 工 (Li & Pollatsek, 2020; Yu et al., 2021)。 区 别 于 以 往 词汇 加 工 模 型 ， 该 模型 
将 重点 解决 句子 加 工 过 程 中 词汇 语义 通达 可 能 出 现 的 问题 及 表现 出 的 眼 动 控 制 
模式 。 其 中 一 个 重要 理论 假设 是 ， 前 文 语 境 对 词 切 分 和 词义 选择 产生 重要 影 
响 。 该 模型 将 能 够 拟 合 中 文句 子 阅 读 过 程 中 相关 的 重要 研究 发 现 ， 包 括 但 不 限 
于 语义 预 视 效 应 (Shen et al., 2018; M. Yan et al., 2009) 和 语义 合理 性 效应 相关 研 
究 发 现 (J. M. Yang et al., 2012; Yao, et al., 2022; J. Zhou & Li, 2021)。 通 过 输入 语 
境 语义 信息 、 调 整 模型 结构 和 参数 、 观 察 模型 模拟 中 的 动态 变化 ， 将 有 利于 深 
入 理解 句子 阅读 过 程 中 词汇 语义 如 何 通 达 、 多 义 词 如 何 选 择 语义 、 语 义 信息 如 
何 与 前 文 语 境 整合 等 一 系列 问题 ， 并 能 够 阐明 以 往 单独 呈现 的 字 词 研究 结果 与 
句子 阅读 研究 结果 不 一 致 的 原因 。 此 外 ， 以 往 探讨 句子 阅读 中 词汇 语义 信息 加 
工 方式 的 实验 研究 数量 有 限 ， 而 计算 模型 的 开发 与 实现 将 指导 实验 研究 。 

最 后 ， 本 研究 在 技术 创新 与 研究 方法 上 具有 贡献 。 与 以 往 模 型 相 比 ， 本 研 
究 拟 建立 的 模型 有 如 下 特点 。 第 一 ， 模 型 既 能 够 加 工 单 字 词 ， 也 能 够 加 工 多 字 
词 ， 第 二 、 模 型 能 够 模拟 词 的 形 、 音 、 义 加 工 过 程 ， 以 及 它们 之 间 的 交互 作 
用 ; 第 三 、 能 够 模拟 句子 加 工 中 上 下 文 语 境 对 词汇 加 工 的 影响 。 这 些 特点 让 本 
研究 建立 的 计算 模型 能 够 刻画 中 文 词汇 加 工 的 动态 过 程 ， 可 以 在 更 大 范围 上 模 
拟 中 文 词汇 语义 加 工 的 认 知 机 制 。 

综 上 ， 本 研究 在 技术 创新 上 充分 利用 计算 模型 具有 准确 性 、 系 统 性 、 能 够 
划 述 动态 过 程 的 特点 ， 通 过 计算 模拟 的 方式 协助 理解 复杂 中 文字 词 识别 的 认 知 
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过 程 ， 同 时 更 好 地 指导 实验 研究 。 在 研究 方法 上 将 实验 研究 与 建 模 研究 有 机 结 
合 ， 利 用 实验 验证 模型 的 假设 和 预测 ， 实 验 结果 又 能 够 推动 对 模型 进行 1 


从 而 螺旋 式 提升 对 中 文 词汇 语义 加 工 机 


dl 的 理 


解 。 
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Abstract: Chinese is a writing system widely used by Chinese people worldwide and 
has many distinct characteristics. Due to its uniqueness, theories and models of 
alphabetic languages cannot be directly applied to Chinese. Previous Chinese studies 
lack systematic computational models for lexical and semantic processing. To address 
this issue, this study first plans to conduct a systematic review and meta-analysis of 
previous literature. Next, computational models will be constructed to simulate the 
processing of Chinese word presented in isolation and during natural reading. The 
model has the following characteristics: a) it can process both single-character and 
multi-character words; b) it can simulate orthographic, phonological, and semantic 
processing of words, as well as their interactions; c) it can simulate the impact of 
contextual cues on word processing during sentence comprehension. Finally, the 
assumptions and predictions of the model are planned to be validated in experimental 
studies. The established model can guide experimental research and has significant 
theoretical significance. The research findings will help clarify the cognitive 
mechanisms of Chinese reading and the dynamic process of lexical processing. 
Keywords: cognitive simulation, lexical processing, semantic processing, Chinese 


reading, computational modelling 
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